BPR (Bayesian Personalized Ranking)模型為 推薦系統 中 協同過濾 策略的模型之一,基於 Matrix Factorization Model 模型等 Latent factor model,BPR 模型以物品的排序為模型的訓練目標,而非只針對使用者、物品之間的評分進行訓練。在物品推薦任務中使用者只在乎系統推薦什麼樣的物品,針對符合使用者過往的排序進行訓練更加貼近使用情境。除此以外 BPR 的目標函式會基於最大化貝氏定理的事後機率(maximum posterior probability)來求得最佳排序所需的參數(user/item latent factor)。
BPR 認為個人化推薦系統為針對每位使用者產生ㄧ個排序的物品清單,該物品清單的產出是基於使用者過往與系統的互動的隱性回饋(Implicit feedback)諸如歷史購買紀錄、瀏覽紀錄等,然而此種使用者紀錄在系統資料量相對物品總數是稀少的,也因此 BPR 的應用情境除了考慮到上述被觀測到的正回饋(observed positive feedback)外,也會針對未被觀測到缺少(missing value)的使用者互動行為(未來可能購買)及實際上使用者的負面回饋(real negative feedback)進行考量。
另外定義了使用者互動過的物品集合
由於整體的資料由所觀測到的隱性回饋
是使用者不喜歡的,因此將其評分定為零分是一個很強並且不利於推導階段使用的假設,這將讓模型對於未來的使用者物品互動
與過往模型不同的是, BPR 將兩兩一組的一對物品作為訓練資料並且針對使用者對於物品的排序作為訓練目標,而非對於其中物品的評分。其假設在已觀測到的使用者互動中
意味著針對使用者
這樣的目標設定有兩個好處: